イプ 


シス テム 至 体 を 見 濃 し 


な が ら 回 路 設 計 を 行う 


ーー IP コア , イン ター フェ ー ス 回 路 , 外部 デバ イス を つない で 


実機 動作 させ る 


高 性 能 な IP コア を 設計 し , RTL コー ド を 作成 し て 論理 合成 し 
て も , それ だ け で は シミ ュ レ ーション し か で きま せん . 最終 的 
に 実 チ ッ プ 上 で 動か な けれ ば 回 路 は 役に立ち ませ ん が , その た 
め に は デー 夕 入出 力 な ど を 行う 周辺 回 路 や 制御 ソフ トウ ェ ア が 
か な ら ず 必要 に な り ま す . た と え 簡 単 な 構成 で も , 周辺 回 路 や 
ソフ トウ ェ ア ま で 合わ せ た 全 シス テム を 一 度 自作 し て みる と ., 
見 渡せ る 世界 は 大 きく 広がり ます . 本 稿 で は , パソ コン 用 の 画 
像 処理 シス テム の 作成 を 例 に , LSI 設計 を 含む シス テム 開発 の 
進め か た を 説明 し ます . な お , 本 稿 で 紹介 する 回 路 の 設計 デー 
タ は 本誌 の Web サイ ト (http://www.cqpub.co.jp/dwm/) 
か ら ダ ウン ロー ド で きま す . (著者 ) 


筆者 は , 本 特集 向け に パソ コン 用 の 画像 処理 シス テム を 
作成 し まし だ その 経緯 は , pp.84.90 の Appendi 実録 画 


@WL 引 回路 設計 の [ココ が すてき 」 


筆者 は 子ども の と きか ら 電子 工作 が 好き で , それ を その まま 
職業 に し まし た . で すか ら , し ご と で ミス を し て 自分 の 未熟 さ 
を 痛感 し た り , 思う よう に 業務 が 進ま な いこ と が あっ た り し て 
も , し ん そこ 苦痛 に 思っ た こと は 一 度 も あり ませ ん .「 回 路 設計 」 
と いう し ご と の 魅力 は , 自分 の 作っ た も の が 世の中 に 出 て 人 の 
役に立つ と か , 進歩 の 速い 分 野 な の で 刺激 が あっ て 楽し いと い 
うこ と が 挙げ られ ます . し か し , いち ば ん 根っこ に ある の ば 自 
分 の 作っ た も の が うま く 動く の を 見 る の が 単純 に うれ し い . そ 
れ が 複雑 で 凝っ た も の で あれ ば な お さら 」 と いう 達成 感 で す . こ 
れ は ソフ トウ ェ ア や メカ な ど , も の 作り に 携わる 人 みん な に 共 
通し て いる の で は な いか と 思い ます . 


國 園 周 
』KeyWord 
田 


バジ ドジ sa イク 。 ミユ レ ー ジ | ジ 


森 賠 倫 夫 


像 処理 シス テム が で きる まで 』」 を 参照 その 際 , 机上 で 
回 路 を 設計 し て シミ ュ レ ーション する だ け で は な く , パソ 
コン と つない で FPGA ボー ド 上 で 実際 に 動か し て み ま し た . 
筆者 は , こう し た 実機 に よる 動作 確認 を で きる だ け 行 うこ 
と を お 勧め し ます . その 理由 を 以下 に 簡単 に まとめ ます . 


@ シミ ュ レ ーション で 動い て も 実機 が 動く と は 限ら な い 

ー つ 目 の 理 由 は , 回 路 設 計 お よび シス テム 設計 に お いて 
「 シミ ュ レ ーション と 実機 動作 は 異な る 場合 が ある 」 と いう 
こと を 理解 する た めで す . 例え ば , シミ ュ レ ーション で 動 
か な い RTI( register transfer level : 現在 の ハー ドウ ェ ア 
記述 言語 を 用 いた 回 路 設 計 で は , この レベ ル の 記述 を 使用 
する こと が 多い ) コ ー ド を 論理 合成 し た と ころ で , 実機 で 
は や は り 動き ませ ん . 逆 に , シミ ュ レ ーション で は RTL コ 
ー ド が 一 見 正しく 動い て いた と し て も , 実機 が 動く と は 限 
り ま せん . 言う まで も な く , 実機 で 動か な い RTL コ ー ド 
に は 何 の 価値 も あり ませ ん . また , その よう に シミ ュ レ ー 
ショ ン と 実機 が か い 離 する 傾向 は , 今後 C ベ ー ス 設計 の 導 
入 な ど で 設 計 の 抽象 度 が 上 が れ ば , より 顕著 に な っ て いき 
ます . 

それ で は シミ ュ レ ーション と 実機 で は 何 が 違っ て いて , 
どう すれ ば 実機 が 動く よう に 設計 で きる の で し ょ うか ? ま 
た , シミ ュ レ ーション 結果 を どの よう に と ら え て いく べき 
な の で し ょ うか ? 

それ を 知る に は , 雑誌 や 書籍 の 解説 記事 を た くさ ん 読 
で 知識 を 詰め 込む より は , 一 度 手 を 動か し て 実機 を 作っ て 
みる ほう が ずっ と 効果 的 だ と 筆者 は 考え まず そう 書く と 


Stratix。 RTL 設計 API 関数 。 PCI バ ス , SDRAM, シン クロ ナイ ザ , セッ ト ア ッ プ 時 間 , ホー ルド 時 間 , 
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本 稿 の 意義 が あや し く な る が …). 実機 作成 は さま ざま な 


機材 お よび 準備 が 必要 な うえ , 何 か ら 手 を つけ て よい か わ 
か り に くく , 最初 は し り 込み し が ち で す . し か し , 実際 に 
や っ て みる と 机上 で の RTL 設計 より も は る か に 楽し いも の 
で す . も し , た また まう まく 動か せな か っ た と し て も , そ 
れ は それ で 良い 経験 に な り ま す . 


⑯ シス テム を 作っ て みる と 回 路 設計 の 考え か た が 変わ る 
ニニ つ 目 の 理由 は , メイ ン の 回 路 ば か り で は な く その 周辺 

回 路 や ソフ トウェア に まで 目 を 向け る こと で , メイ ン の 回 路 

の 設計 の し か た も グッ と 良く な る か ら で す . シス テム 全体 が 

見 えて く れ ば , 次 の よう な 著しく バラ ンス を 欠い た 設計 

( ちょ っ と 極端 な た と え だ が …) を 行う こと が 少な く な り ま す . 

e パソ コン と FPGA ボー ド の 間 の 接続 に PCI バ ス を 使う シ 
ステ ム で , デー タ 転 送 速 度 が 1Gbps 未 滴 33MHz 時 ) で 
ある に も か か わら ず , FPGA に 100Gbps の 高 性 能 で 巨大 
な 回 路 を 載せ て し まう . っ その 人 性能 を 発揮 させ る こと は 
決し て で き な い 

e デー タ を ] バ イト ご と FPGA に 送っ て は 戻す と いっ た 処 
理 を 行い , ハー ドウ ェ ア 性 能 を 殺し て し まう . っ オー バ 
ヘッ ド が 減る を よう に , デー タ 転送 は な る べく まとめ て 行 
うほ う が よ い . 

e ちょ っ と し た デー タ 変換 や 1 軸 し か 行わ な い 浮 動 小数 点 
演算 な ど , ソフ トウ ェ ア で 簡単 に 作れ る 処理 を すべ て ハ 
ー ド ウェ ア で 実現 し よう と する . つ 回 路 が いた ずら に 複 
雑 に な る うえ , デバ ッ グ も 難し く な る . 


@ 複数 人 に よる 共同 開発 を うま く 進め る に は 

三 つ 目 の 理由 は より 実務 的 な こと で す が , シス テム 全体 
を 見 渡し て 動く モノ を し あげ る スキ ル そ の も の に 価値 が あ 
る か ら で す . 


注 1: 一 見 あたり まえ の こと な の だ が , 現実 に は な か な か 思い どおり に いか 
な いこ と が 多い と 思う. うま くい か な い 開 発 で は , 「 自分 の か か わっ 
た と ころ だ け 動 け ば いい 」 と いう ムー ド が 広がっ て いる こと が 多い よ 
う だ. 

注 2: で きれ ば 本 誌 2005 年 3 月 太 参考 文献 1)) を 併 読 し て いた だ きた い . 
「 メイ ン の 回 路 だ け で な く , その 周辺 回 路 や ソフ トウ ェ ア ま で 合わ せ 
た シス テム を 作る 」 と いう テー マ で , 例題 を 交え な が ら で き る だ け 簡 
潔 に 説明 し て いる . 

注 3: 最大 サイ ズ の 画像 を FPGA ボー ド へ 転送 する の に 約 1 稼 4M バ イト /s 
て 8M バイ ト /s), FPGA 上 の 画像 処理 に 約 05 秒 か か る . 

注 4: パソ コン の 電源 ON 時 に FPGA は プロ グラ ミン グ さ れ て いな い が , OS 
が 立ち 上 が っ た 後 で FPGA を プロ グラ ミン グ し て も PCI デ バイ ス と し 
て 認識 され な い 場 合 が 多い . PCI ク ロッ ク が 停止 し て し まう た めで あ 
る . そこ で , ハー ド ウェ ア ・ リ セッ ト を 押し な が ら パ ソコ ン の 電源 を 
入れ , FPGA を プロ グラ ミン グ し た 後 で リセット 解除 する と , うま く 
動作 する . また , FPGA 開発 環境 は 別 の パソ コン 上 に 作っ て お く こと. 
参考 文献 3) に 詳し く 説明 され て いる . 
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し ご と で も の 作り を 行う 場合 , 複数 人 場合 に よっ て は 
複数 社 ) で 作業 を 分担 す る の が 普通 で す . そう し た 場合 , そ 
れ ぞ れ の 担当 箇所 や 開発 スケジュ ー ル な ど を 決め て し ご と 
を うま く 進め て いく た め に , シス テム 全体 を 把握 で きる 人 
が 必要 で す . も ちろ ん リー ダ 役 の 人 だ け で な く , 実務 担当 
者 も 意識 し て 全体 を な が め る よう に し て いな いと , ほか の 
担当 者 と の 技術 的 な 調整 を 図れ ませ ん し , 問題 が 起き た と 
き に 解決 で き な い 状況 に なり ます *1. 


9 和 二 シス テム の 慣 能 本 


今回 作成 し た も の は , 比較 的 実用 に 近い レベ ル の シス テ 
ム で す * ま 2. 画像 処理 回 路 を FPGA ボー ド に 搭載 し , パソ 
コン 上 で 動く 一 つの 画像 処理 シス テム の 形 に まとめ て いま 
す . 画像 処理 回 路 本 体 の 設計 に つい て は , 本 特集 の 第 4 章 
を 参照 し て くだ さい . ここ で は , 画像 処理 回 路 を 使っ て 一 
つの まとまっ た シス テム を くみ 上 げ る 部 分 を 説明 し ます . 


信 作る の は 画像 処理 の アク セラ レー タ ・ ボ ー ド 

図 1 に 本 シス テム の 概要 を 示し ます . パソ コン 上 に ある 
24 ビ ッ ト ・ ビ ッ ト マッ プ ・ フ ァイル の デー タ を FPGA ボー 
ド に 転送 し 注 3 その うえ で フィ ル タ な どの 画像 処理 を 施し , 
再び パソ コン へ 戻し て ビッ ト マッ プ ・ フ ァイル で 結果 を 得 
ます . 一 連 の 操作 は , 筆者 が 作成 し た 図 2 に 示す よう な GUI 
( graphical user interface) を 使っ て パソ コン 上 で 行え ま 
す . OS は Windows 2000/XP に 対応 し て いま す . 実行 可 
能 な 画像 処理 の 一 覧 を 表 1 に 示し ます . GUI 上 で パラ メー 
タ を 設定 し て 多種 多様 な 変換 操作 を 行え を ます が , ここ で は 
洋 細 は 割愛 し ます . 第 4 章 の 記事 や 配布 デー 包 本 誌 の Web 
サイ ト か ら ダウンロード 可能 ) の 中 の 説明 を 参照 し て くだ 
さい . 

FPGA ボー ド と し て , 今回 は CQ 出 版 社 の Stratix 評 f 
キッ ト ( 米国 Altera 社 の FPGA EP1S10』 を 搭載)1 2 を 使 
用 し まし た . 本 評価 キッ ト で な く て も 8M バ イト 以上 の 
SDRAM と PQI 端子 を 搭載 し て いる FPGA ボー ド で あれ 
ば , ピン 割り 当て な どの 軽微 な 変更 で 今回 の シス テム は 動 
く と 思い ます . FPGA ボー ド は , パソ コン の 33MHz PCI 
スロ ッ ト に 挿し て 使い ます . パソ コン と し て は な る べく ハ 
ー ド ウェ ア ・ リ セッ ト ・ ス イッ チ が 付い て いる も の を 使用 
する こと を お 和 勧め し ます . また , FPGA プロ グラ ミン グ 用 
の パソ コン は 別途 用 意 し て お きま す ぜ 4 


kc 


な お , 今回 は シス テム を と に か く 作っ て みる こと が 第 一 
目的 な の で , 機能 や 性 能 に つい て は あま り 追求 し て いま せ 
ん . し か し , 次 の よう な く ふう を 施す こと で , より 実用 品 
に 近い シス テム に な る で し ょ う . 

e 今回 は 1 枚 の 画像 を 入力 と する 処理 し か な い が , 重ね 合 
わせ や マッ チン グ な ど , 2 枚 の 画像 を 入力 と する 処理 を 
作っ て みる 

eFPGA ボー ド で の 処理 の 終了 を パソ コン に 通知 する た め 
に , PCI 経由 の 割り 込み を 使う . 今回 は 処理 時 間 が 短い 
の で , 割り 込み は 使っ て いな い 

eFPGA 内 部 回 路 の 動作 クロ ッ ク を 上 げ る . 今回 は PCI ク 
ロッ クベ X 2 の 66MHz で 動作 させ た が , まだ 余裕 が ある 


Im 


FPGA 制御 ソフ ト ウェ ア 図 


画像 格納 用 


プロ グラ ミン グ 用 図 SDRAM 


パソ コン 較 
図 1 画像 処理 シス テム の 全体 図 


画像 処理 IP コア を FPGA に 実装 し , その FPGA を 搭載 し た ボー ド を パソ コン 
と PCI バス 経由 で 接続 する . パソ コン 上 の 画像 ファ イル を ボー ド へ 転送 し , 
いろ いろ な 加工 処理 を 行っ た 後 , 結果 を パソ コン へ 戻す . この 一 連 の 処理 操 
作 は , パソ コン 上 の 制御 ソフ ト ウェ ア ( GUI) か ら 簡単 に 行え る . FPGA の プ 
ログ ラミ ンタ コン フィ グレ ーション ) に は 別 の パソ コン を 用 いる . 


表 1 作成 する 画像 処理 シス テム の 基本 機能 
よく 知ら れ て いる 代表 的 な 画像 変換 処理 を 自由 に 行え る . FPGA 内 部 で さら 
に 高速 な クロ ッ ク を 生成 すれ ば , 処理 速度 を も っ と 向上 させ られ る が , 今 
は そこ まで は や っ て いな い . 

入力 画像 形式 
出力 画像 形式 
画像 サイ ズ 


24 ビ ッ ト RGB 画像 BMP ファ イル な ど ) 
24 ビ ッ ト RGB 画 像 BMP ファ イル な ど ) 
1x 1~ 1024X 512 画 素 可変 ) を 計 4 枚 
3X 3 フィ ル タ 処 理 係数 は 自由 に 設定 可能 


処 理 e レ ベル 変換 RGB 値 の テー ブル 置換 ) 

e ヒ スト グラ ム 算 出 , ヒス ト グラ ム 平 た ん 化 
実測 約 24M ピク セル /s, 33MHz PCI ク ロッ ク 時 
( 速度 向上 は 可能 ) 


処理 速度 


信 実機 作成 と IP コア 設計 の 相違 点 
RTL 設 赦 IP コア の 設計 ) と 実機 作成 に お いて , も っ と 
も 異な る の は 次 の 2 点 で ず 表 2). 

e ポイ ント 1 一 一 単 一 クロ ッ ク で 動く IP コア と は 異な り , 
実機 の 場合 は 動作 速度 の 異な る いく つか の ブロ ッ ク を 
つなぎ 合わ せる の が 普通 . ここ で いう ブロ ッ ク と は , チ 
ッ プ 内 の 回 路 モ ジュ ー ル だ け で な く , チッ プ の 外 に あ 
る 各種 デバ イス や ソフ ト ウェア まで 含ま れる . それ ら 
の 間 で デー タ を 確実 に や り と りす る 方 法 が 必要 に な る 

e ポイ ント 2 一 一 実機 を 動か し て いく 作業 は , RTL シ ミ 
ュ レ ーション の 場合 と 比べ て , ボ ト ム ア ッ プ の 色合い 
が 強い も の に な る . どの 部 分 が どの よう に 動い て いる 
か を 自由 に 追跡 で き な い か ら で あ る . この た め , 設計 


手順 1 】 入 出力 較 1 Selsct ie 
ビッ ト マッ プ ・ ファ jnput BMP File 
Output BMP File 


ル を 指定 SW) 


手順 2】 画 像 処理 
を 行う SDRAM セ 凶 
グ メ ント を 指定 図 vo 
P FNNed 01667 06667 01667 

手順 3】 画像 処理 で re rel og ee ーー 
の 種類 や パラ メー 01667| 06667| Qi667 記 中 Bill 思 Shmp | 
タ を 指定 較 Tween 

の 

F Treshoed「 
手順 4】 指 定 し た 四 neval | 
処理 を FPGA 上 で 鐘 - 
実行 する 較 人 


図 2 画像 処理 レシ レス テム の 基本 的 な 使い か た 

図 の よう な GUI を 用 い , パソ コン 上 か ら FPGA ボー ド を 簡単 に 使う こと が 
で きる . 画像 デー タ ・ フ ァイル や パラ メー タ 値 , 処理 の 種類 な ど を 入力 し 
て スタ ー ト ・ ボ タン を 押す と , 必要 な 情報 が FPGA へ 送ら れ て 処理 が 行わ 
れる . 


表 2 画像 処理 シス テム 設計 に お ける 技術 上 の 注意 点 

実機 で 動か す シ ステ ム の 設計 と テス ト に は , 一 般 の RTL 設 計 と は 異な る セ 
ンス が 必要 で ある . と くに , ソフ トウ ェ ア と ハー ドウ ェ ア , ある い は 複数 の 
ハー ドウ ェ ア ・ ブ ロッ ク な ど , 実機 で は 速 腐 クロ ッ ク ) の 異な る 複数 の 処理 
が 並列 に 動く の で , 処理 問 の 同期 や 回 路 接 続 部 の 設計 に か な り の 注意 が 必要 
と な る . また , 実機 が シミ ュ レ ーション どおり に 動く と は 限ら な いし , ボ ト 
ム ア ッ プ で テス ト を 進め る 必要 も ある . 


| ジー ジラ /5 ロ ーー クタ < 
回 路 設 計 


PCI バス ・ タ ー ゲ ッ ト , SDRAM 


クロ ッ ク の 異な る 回 路 の 接続 方 法 , 全体 回 
路 の まとめ か た 

レジ スタ 経由 の デー タ 交換 , ハー ド ウェ ア 
処理 の 起動 , ソフ トウ ェ ア と ハー ド ウェア 
の 同期 ポー リン グ , 割り 込み) 

GUI の イ ベン ト ・ ド リブ ン と ハー ドウ ェ ア 
制御 処理 と の 兼ね 合い 

実機 を 動か し て いく た め の テ スト 手順 , 設 
計 モ ジュ ー ル 分 割 の し か た 


回 路 間接 続 


レン 4Ri( モ の 2 バド 
ウェ ア の 間 の や り 取り 


ソフ トウ ェ ア の 
Zi 回 グラ ミン シク 


開発 作業 の や りか た 
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ソフ トウ ェ ア ( C 言 語 ) 


アプ リケーション ・ プ ログ ラム 国 
( 今回 は 画像 処理 GUI) 図 


画像 処理 FPGA 駆動 用 API 


PCI バ ス 経由 ハー ド ウェ ア ・ 較 


ソフ トウ ェ ア ( C 言 語 ) 凶 


アプ リケーション ・ 罰 


乗算 IP コア 駆動 API 


COM1 デ バイ ス ・ ド ライ バ 叶 


プロ グラ ム 較 


図 3 


RS-232-C と ケー ブル 図画 像 処理 シス テム の 基本 設 証 


SDRAM 較 


画像 処理 IP コア 哨 


イン ター フェ ー ス ・ コ ア 加 


乗算 IP コア 制御 回 路 較 
( コマ ンド 解釈 ) 凶 


ソフ ト ウェ ア と ハー ド ウェ ア を 合わ せ た シ 
ステ ム を 作る うえ で 重要 な ポイ ント の 一 つ 
は , 処理 の 階層 化 で ある . ソフ ト ウェ ア 
側 で は , アプ リケーション を 最上 位 と し 
て ハー ド ウェ ア 側 へ 向かっ て 階層 を 作り , 
抽象 度 を 下げ て いく . ハー ド ウェ ア 側 で 
は , ソフ ト ウェ ア の 各階 層 と ペア を 作り 
な が ら , 逆 の 形 で 抽象 度 を 上 げ て いく . 各 
ブロ ッ ク の 作成 は , 高 性 能 ・ 高 機能 を ね 


RS-232-C 図 


乗算 IP コア 図 


イン ター フェ ー ス ・ コ ア 了 


ハー ド ウェア 罰 
( a) 今回 作成 し た シス テム 図 


モジ ュー ル の 分 割 の し か た や テス ト 手順 を く ふう する 
必要 が ある 
これ ら 二 つ に つい て は , 後 で 重点 的 に 説明 し ます . まず 
は , 本 シス テム の 全体 構成 を ざっ と 見 て みる こと に し ます . 


⑱ ソフ ト と ハー ド を ペア に し た 階層 設計 を 行う 
図 3 に 示す と お り , ソフ トウ ェ ア 今回 は 言語 を 使う ) 
か ら ハ ー ド ウェ ア に 至る まで の デー タ の 流れ に 沿っ て , 処 
理 ブ ロック の 階層 を 作り ます . 階層 を 作る お も な 理由 は 
意味 的 に まとまっ た 処理 ご と に 区 切り を つけ る こと に よっ 
て , 設計 と デバ ッ グ を 容易 に する こと で す . この 階層 は や 
みく も に 作っ て いる わけ で は な く , いく つか の ルー ル に 基 
づい て 構成 し て いま す . 具体 的 な 内 容 は 後述 し ます . 
e 階層 の 両端 に ある の が , も と も と 実行 し た い 処 理 画 
像 処理 ) を 担当 する ブロ ッ ク 
e 中 間 に あ る 階層 は いずれ も デー タ 転送 の 役割 を 担う . 
デー タ ・ フォー マッ ト 変換 や 速度 変換 な ど を 行う 
り 羽 に 必 se の 25 王 民 記 人 同 有 6 ツ ド ウ 旦 
ア 側 で は 徐々 に 抽象 度 が 下がる . 逆 に , ハー ド ウェア 
側 で は 徐々 に 抽象 度 が 上 が る . ここ で , 抽象 度 と は 
「 処理 が 本 来 の 内 容 画像 処理 ) そ の まま で ある ほど 高 
く , 直接 関係 な い 処 理 が 多い ほど 低く な る も の 」 と 考 
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ハー ドウ ェ ア 罰 


( b) 簡単 な と ステ ム 例 較 
( 2005 年 3 月 号 で 作成 し た 乗算 回 路 駆動 シス テム 


ら わな けれ ば 意外 と 簡単 に 行え る . 学習 
目的 で あれ ば , 初め か ら 高 性 能 を ね ら わ 
ず , まず は 全体 を し あげ て 実機 と し て 動 
か し て みる こと が 大 事 . 


EE GWWG2GSS28WY 

e ソ フト ウェ ア の 階層 と ハー ド ウェ ア の 階層 で ペア を 作る 
こう し た 階層 の 作り かたは, ほか の シス テム の 場合 で も 
基本 的 に 同じ で す . 

今回 は , ソフ ト ウェ ア 側 と ハー ド ウェ ア 側 の それ ぞ れ に 
3 段 の 階層 が あり ます . 各階 層 の お お よそ の 機能 は 以下 の 
と お り で す . 

1) 画像 処理 その も の を 担当 する 階層 

ソフ トウ ェ ア 側 の 最上 段 図 2 の GUI) と ハー ド ウェア 側 
の 最 下 棄 第 4 章 で 解説 する IP コア ) の ペア は , フィ ル タ な 
どの 画像 処理 その も の を 担当 し ます . ユー ザ 側 か ら 見 える 
「 GUI 経由 で デー タ を 送る と 処理 が な され る 」 と いう 動き は , 
この ペア に よる も の で す . 

2) 画像 処理 IP コア の API を 提供 する 階層 

シス テム の 内 部 に は , GUI が 受け 取っ た デー タ を IP コア 
へ 転送 し た り , IP コア に 処理 開始 コマ ンド を 送っ た りす る 
通信 経路 が あり ます . つま り , GUI は 直接 FPGA を 操作 
する の で は な く , 専用 の 通信 経路 を 介し て 操作 する の で す . 
この 経路 を 提供 する の が API application prograrmming 
interface) と いう 階層 で す . これ も ソフ ト ウェ ア 側 と ハー 
ド ウェア 側 で ペア を 構成 し て いま す . 

デー タ を 転送 する と いう と 簡単 な よう で す が , GUI と IP 
コア の 速度 差 を 吸収 し た り , ソフ トウ ェ ア と ハー ド ウェ ア 
の デー タ ・ フ ォ ー マ ッ ト を 変換 する な ど , 実際 に は いろ い 


1 79eged0 | ヽ 


表 3 API 関数 


piccopro_ipif_inif ) 


回 路 を 初期 化し , 各種 情報 デバ イス ・ ハ ンド ラ に 相当 ) を 取得 する 


アプ リケーション に 提供 され る API 関数 の 


実例 piccopro_ipif_setdat& ) 


処理 する デー タ を FPGA ボー ド へ 転送 する 


FPGA で 行う 個々 の 画像 処理 が 関数 に な っ て い BIS9BNo。ipllLgMat 


処理 し た デー タ を FPGA ボー ド か ら 取り 出す 


る だ け で ある . 関数 を 呼ん で り ター ン し て きた | PIGcopro_-ipfLresetsiz《 ) 


画像 サイ ズ を 設定 する 


と き , 処理 は 完了 し て いる . た だ し , 時 間 の piccopro_ipif_execfilte ) 


フィ ル タ 処 理 を 実行 する 


か か る 処理 を FPGA で 行い た い 場 合 は , プロ piccopro_ipif_exectblconv ) 


テー ブル 変換 処理 を 実行 する 


グラ ミン グ が や や 複雑 に な る . その 場合 割り piccopro_ipif_exectrans ) 


FPGA ボー ド 内 で 画像 デー タ の コピ ー を 実行 する 


込み に よっ て 処理 完了 通知 を 受け 取る 方式 を と 
る と よい ( と くに イベ ント ・ ド リブ ン 処 理 の 


piccopro_ipif_gethis《 ) 


画像 の ヒス ト グラ ム を 取得 する 


GUI を 用 いる 場合 な ど ). piccopro_ipif flattern_his《 ) 


ろ と や る 事 が あり ます . 
3) PCI バ ス に よる デー タ 転送 階 層 

API 層 の 下 に は , ソフ トウ ェ ア と ハー ド ウェア の ちょ う 
ど 接 点 に あたる 部 分 と し て , PCI バ ス を 実際 に 使っ て デー 
タ 転 送 を 行う た め の 階 層 が あり ます . 図 3 で は これ を 最 下 
層 と し て いま す が , 現実 に は パソ コン の 内 部 に さら に いく 
つか の 階層 が あり まず 今回 は そこ に は 触れ な い ). 

この 階層 の 処理 を 差し 替え る こと で , 例え ば USB など, 
PCI バ ス 以 外 の イン ター フェ ー ス で 通信 を 行う よう に する 
こと も 可能 で す . 


上 則 昌 の テー タ 婦 信 の し くみ 


次 に , 上 述 し た 実機 作成 の ポイ ント の 一 つ 目 で ある , 各 
ブロ ッ ク 間 の デー タ の や り と り について, 階層 の 上 か ら 順 
に 説明 し ます . 


@ アプ リケーション と API の や り と り は 普通 の C と 同じ 
アプ リケーション ・ プ ログ ラバ GUI) か ら 使用 で きる 
API 届 図 3 の 上 か ら 2 番目 ) の C 関 数 を 表 3 に 示し ます . 
これ ら の 関数 は , 次 の 二 つ に 分 けら れ ま す . 
eFPGA ボー ド を 初期 化し , デバ イス ・ ハ ンド ラ に 相当 す 
る 値 を 取得 する 関数 
e パソ コン の メモ リ 上 の バッ ファ に 格納 され た 画像 に 対し , 
個々 の 画像 処理 を 行う 関数 
アプ リケーション か ら 見 た 画像 処理 の 動き を 図 4 に 示し 
ます . アプ リケーション は 実行 し た い 処理 の 関数 を 呼ぶ だ 
け で よく , 関数 か ら 戻 っ て きた と き に は 処理 が 完了 し て い 
まず 。 と の た め ,。 アデ リケーション の プロ グラ ミン シング で は , 
処理 が ハー ド ウェ ア で 行わ れ て いる と いう こと を ほとん ど 
意識 し な く て すみ ます . ソフ ト ウェ ア で 同一 名 の 関数 を 作 
っ た 場合 と の 違い は 速度 だ け で す . その た め , ハー ド ウェ 


画像 の ヒス ト グラ ム 平 た ん 化 処理 を 行う 


3 ニニ 由 ア プリ ケー ショ ン 側 か ら は , 専用 の C 区 
| (2 人 GU) | を 時 と 処理 され て 近 っ て くる よ 
うに 見 える 


デー タ を 転送 する 中 間 層 図 
( ブラ ッ ク ボ ックス ) 


画像 処理 P コ ア か ら は , デー タ や 起動 b 
トリ ガ が や っ て 来る よう に 見 える 図 


画像 処理 IP コア 陸 


アプ リケーション 較 画像 処理 IP コア 図 
動作 中 | 関数 CALL 
数 リタ ー ン 図 … 動作 中 図 
動作 中 関数 CALL 
、 敵 基 リタ ー ン 図 。… 動作 中 図 
動作 中 
0 


【 よく ある 検討 事項 】 較 
e 処理 の スタ ー ト を か ける の は どちら ? 図 
っ 今回 は つね に アプ リケーション 罰 
e 処理 の 終わ り を 知ら せる の は どちら ? 図 
っ 今回 は つね に アプ リケーション が チェ ッ ク 較 
e 両方 が 同時 に 動く の か , 一 方 だ けが 動く の か ? 限 
っ 今回 は どちら か 一 方 だ けが 動く 図 


図 4 アプ リケーション か ら 見 た 場合 の デー タ の や り と り 

専用 の 画像 処理 関数 を 呼ぶ だ け で , アプ リケーション か ら 回 路 を 動か せる . 
アプ リケーション か ら 見 た 場合 , 回 路 で 処理 が な され て いる の か , パソ コン 
で 処理 が な され て いる の か , 区 別 は ほとん ど な い . 


ア が 何 も で き 上 が っ て いな い 状 況 で も , ソフ トウ ェ ア だ け で 
アプ リケーション 部 を 作成, デバッグ する こと が 可能 で す . 


⑯ アプ リケーション と API の 間 の 交信 を アレ ンジ する 
アプ リケーション と API の 間 の 交信 に つい て は , 今回 と 
は 別 の 方 法 も あり ます . 

1) アプ リケーション と ハー ド ウェ ア の 処理 を 並行 実行 
FPGA 側 の 処理 時 間 が 非常 に 長く か か る よう な 場合 , 今 

の よう に アプ リケーション 実行 と FPGA 処理 実行 の どちら 

か 一 方 し か 動か さ な い の で は な く , 両方 の 処理 実行 を 並列 に 


cs! 
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表 4 アド レス 


備 考 


API か ら 見 た 場合 の 制御 回 路 


メモ リ ・ マ ッ ズ FPGA ロー | OO0000 


処理 起 重 書き 込み 時 ) 処理 制御 用 レジ スタ 


回 路 の 強制 リセ ッ ト も 可能 


カル ) の 例 Ox002000 


旧 
処理 ステ ー タ ス ( 読み 出し 時 ) 
処理 コマ ンド 種類 / 処 理 バッ ファ 指定 


パラ メー タ 用 レジ スタ 


アプ リケーション か ら 制 御 関数 Ox002004 


画像 横 サ イズ パラ メー タ 用 レジ スタ 


が 呼ば れ た と き , これ ら の レジ | oxoopoog 


画像 縦 サイ ズ パラ メー タ 用 レジ スタ 


スタ を 読み 書き する こと で 処理 


Ox002040-60 


3X 3 フィ ル タ 係 数 計 9 個 ) パラ メー タ 用 レジ スタ 


が 進む . アプ リケーション か ら 


ハー ドウ ェ ア を 見 た 場合 と 異な Ox0024002FFC 


ヒス ト グラ ム 計 測 値 各 RGB に つき 256 階 調 ) | パラ メー タ 用 レジ スタ 


り , ハー ド ウェ ア の 内 部 構成 に Ox003000-33FC 


デー タ 変換 テー ブル ( 各 RGB に つき 256 階 調 ) | パラ メー タ 用 レジ スタ 


密着 する こと に な り , ハー ドウ Ox000000-07FFFC 


画像 メモ リ ・ バ ッ フ ァ #0 デー タ 用 レジ スタ 


ェ ア ( FPGA) と ソフ ト ウェア パ Ox0800000FFFFC 


画像 メモ リ ・ バ ッ フ ァ #1 デー タ 用 レジ スタ 


ソコ ン ) が 並列 に 動い て いる こと 


を 強く 意識 する 必要 も ある . な Ox10000017FFFC 


人 | 人 を | を | ミ | タ | ミ | ミ | ミ | ミ 


画像 メモ リ ・ バ ッ フ ァ #2 デー タ 用 レジ スタ 


ー|ー つ ーー|O|O|O の | の | の O の | の 


お , 表 の 中 の R は 読み 出し , W Ox180000-1FFFFC 


は 書き 込み を 意味 する . 


行わ せる の が 得策 で すま 5 その よう な 場合 , 処理 終了 を 待 
た ず に 関数 か ら リ ター ン し て お き , FPGA 処理 の 実行 終了 通 
知 を PQI 経由 の 割り 込み に よっ て 受け 取る か , また は アプ リ 
ケー ショ ン か ら 処 理 終了 を 別途 調べ に いく 形態 に し ます . 
アプ リケーション ・ プ ログ ラム が ハー ド ウェ ア 処 理 の 終 
了 を どの よう な 方 法 で 知る か は , プロ グラ ム の 構造 設計 に 
大 きく 影響 を 与 ん る る の で , シス テム 設計 の 初期 段階 で よく 
考え て 決め る よう に し ます . 
2) ハー ドウ ェ ア か ら ア プリ ケー ショ ン を 起動 させ る 
今回 は アプ リケーション が FPGA の 処理 を 起動 し ます が 
逆 に FPGA が アプ リケーション の 処理 を 起動 する ケー ス も 
考え られ ます . 例え ば , FPGA ボー ド が 外部 か ら 画像 デー 
タ を 受け 取り , それ を パソ コン に 渡す よう な 場合 で す . こ 


表 5 API 内 部 で 使う 補助 関数 群 


表 3 の 各 API 関数 の 内 部 で は , これ ら の 関数 群 を 組み 合わ せ て 処理 が 行わ れ 
る . これ ら の 関数 は , 表 4 の FPGA ロー カル ・ メ モリ 空間 へ の 読み 書き を 行 
う も の で ある . 


補助 関数 群 内 容 


回 路 を 初期 化し , 各種 情報 デバ イス ・ 
ハン ドラ に 相当 ) を 取得 する 


piccoproregif_init ) 


に 5 処理 する デー タ を FPGA ボー ド へ 転送 
piccopro_regif_setdat& ) す 


処理 する デー タ を FPGA ボー ド か ら 取 
り 出 す 


piccopro_regif_setcmd ) 処理 の 種類 を FPGA ボー ド へ 書き : 
画像 の サイ ズ を FPGA ボー ド 
フィ ル タ 係 数 を FPGA ボー ド へ 
置換 テー ブル を FPGA ボー ド へ 


piccopro_regif_getdat& ) 


piccopro_regif_setsize ) 


piccopro_regif_setfilte ) 


piccopro_regif_settablg ) 


piccoproregif_gethis《 ) ら 読 み 出す 


設定 し た 処理 を FPGA に 実行 させ る 


piccopro_regif_execcmd ) 


と くに , GUI を 使う た め に イベ ント ・ ド リブ ン ・ プ ログ ラミ ング を 行 
う 場合 , その よう に 並列 化 を 施し て いな いと , ひど く 応 人 答 性 の 悪い ソ 
フト ウェ ア に な っ て し まう . 


注 5: 
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カ 
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画像 メモ リ ・ バ ッ フ ァ #3 デー タ 用 レジ スタ 


の 場合 も , FPGA か ら パ ソコ ン 側 へ 割り 込み を か ける 形態 
に な り ま す . 


@ API と ハー ド の 間 は メモ リ ・ マ ッ プ を 介し て や り と り 
次 に , API と ハー ドウ ェ T 図 3 の PCI ド ライ バ ) の 間 で 
どの よう な や り と り が 行わ れる か を 見 て み ま し ょ う . 
で は , FPGA の ハー ド ウェ ア と し て の 動き を か な り 意識 す 
る こと に な り ま す . 

API と ハー ド ウェ ア の 間 で は , 割り 込み を 除き , メモ リ 
空間 の 読み 書き で デー タ を や り 取り する こと に な り ま す . 
この メモ リ 空間 は , APT と ペア に な っ て いる 画像 処理 IP 


アプ リケーション か ら 関数 CALL さ れる 較 


画像 処理 FPGA 駆動 API 


IP コア 制御 回 路 の メモ リ 空間 の 読み 書き に 翻訳 凶 


デー タ を 転送 する 中 間 層 較 
( ブラ ッ ク ボ ックス ) 図 


IP コア 制御 回 路 メ モリ の 読み 


画像 処理 IP コア 制御 回 路 図 


画像 処理 PP コア な ど ヘ データ や トリ ガ を 送る 図 


IW 


書き アク セス 図 


アプ リ ケ ー シ ョ API IP コア 制御 回 路 較 IP コア [ 
関数 CALL 6 
人 に テモ リ 書き 込み 四 デー 転送 図 
終了 図 トー 一 鍛 了 図 
メモ リ 読み 出し 関 -- デ ー タ 要求 
間 し ーー ュー ニー ニー ドー データ 転送 図 
ーー 関 数 リタ ー ン 較 2 タ 転 送 較 


5 API か ら 見 た 場合 の デー タ の や り と り 

FPGA 側 に メモ リ ・ ア ドレ ス 空 間 を 持た せ , そこ に デー タ を 読み 書き する こ 
と で API と FPGA が 交信 する . この メモ リ 空間 は FPGA ロー カル の も の で , 
パソ コン の メモ リ 空間 と は 別 で ある . な お , 組み 込み CPU を 使う 場合 , 回 
路 の メモ リ 空間 を CPU の メモ リ 空間 に 直接 マッ プ す る こと が 多い . 


IP コア 制御 回 路 メ モリ 空間 の 読み 書き じ 


PIN イイ 9 ラド トウ se 上 M 


PCI バ ス の トラ ン ザ クシ ョ ン に 翻訳 図 


デー タ を 転送 する 中 間 層 図 
( ブラ ッ ク ボ ックス ) 図 


PCI バ ス の トラ ン ザ クシ ョ ン が 来る 図 


PCI バ ス ・ 図 
イン ター フェ ー ス ・ コ ア 罰 


IP コア 制御 回 路 メ モリ 空間 の 読み 書き じ 


図 6 PCI バ ス を 使っ た デー タ の や り と り 


FPGA ロー カル ・ メ モリ 空間 へ の 読み 書き は , さら に PCI バ ス 上 で の トラ ン 
ザク ショ ン に 翻訳 され て 交信 され る . ここ で は 省略 し て いる が , PCI ド ライ バ 
と PCI バ ス ・ イ ンタ ー フ ェ ー ス 回 路 の 間 に も さま ざま な 処理 階層 が 存在 する . 


コア 制御 回 路 」 の 内 部 に ロー カル に 作ら れ て いる も の で , パ 


ソコ ン や PCI の メ モリ 空間 と は 直接 関係 あり ませ ん . 
表 4 に , 実際 の ロー カル ・ メ モリ 空間 の 例 を 示し ます . 


API 関数 は ロー カル ・ メ モリ 空間 の 読み 書き を 行う こと で 
処理 を 進め ます . 例え ば , 表 3 に お ける フィ ル タ 処 理 実行 
関数 piccopro_ipif_execfilter の 動作 は 次 の と お り で す . 参 
考 文献 1) に も 同じ よう な 例 が ある の で 参照 し て くだ さい . 
1) パソ コン 上 の メモ リ に 置か れ た 画像 デー タ ( 関数 の 引き 
数 に 渡さ れる ) を , ロー カル ・ メ モリ 空間 上 の バッ ファ 
へ コピ ー す る 
2) 同じ く , フィ ル タ 係数 値 を ロー カル ・ メ モリ 空 
該当 アド レス へ 書き 込む 
3) コマ ンド 種類 と し フィ ル タ 処 理 」 を 指定 する . これ 
も 該当 アド レス へ の 書き 込み で 行う 
4) 処理 起動 用 コマ ンド ・ レ ジス 人 アド レス Ox000000) に 
1 を 書き 込む と , FPGA が 処理 を 開始 する 
5) ステ ー タ ス ・ レ ジス 人 包 アド レス Ox000000) が 0 に な 
る まで , つま り 処理 が 終わ る まで API が 待つ 
実際 に は , ロー カル ・ メ モリ 空間 の 読み 書き は 表 5 の よ 
うな 補助 関数 群 を 使っ て 行い ます . この 補助 関数 群 は , 同 
じ 処 理 を 1 ヵ所 に まとめ る た め に 設け て あり ます . 
以上 の 動作 の よう す を 図 5 に 示し ます . アプ リ ケ ー シ ョ 
2 
空間 の 読み 書き を 何 度 か 行い ます . 一 方 , API と ペア 
層 Ne 
の アク セス 要求 を 受け 取る と , IP コア 本 体 と の デー タ 転送 
を 適宜 行い ます . 


間 上 の 


FPGA ロー カル ・ 
メモ リ 空間 B 


画像 処理 IP コア の 図 
ロー カル ・ メ モリ 図 
空間 A 


PC ターゲット ・ 図 
メモ リ 空間 C 


ソフ ト ウェ ア 側 で は , 左 か ら 右 へ 順次 変換 較 


ハー ド ウェ ア 側 で は , 右 か ら 左 へ 順次 変換 較 


図 7 メモ リ 空間 の マッ ピン グ の 繰り 返し 

表 4 の FPGA ロー カル ・ メ モリ 空間 は , パソ コン の PCI デバ イス の 固有 メモ 
リ 空間 の 一 部 に マッ プ さ れる . それ は パソ コン の メモ リ 空間 の 一 部 に も マッ 
プ さ れる . また , 画像 処理 IP コア その も の も ロー カル な メモ リ 空間 を 持っ 
て いる . メモ リ ・ ア ドレ ス は , ソフ ト ウェア 設計 階層 を 上 か ら 下 へ 通過 し て 
いく 過程 に お いて 図 の 左 か ら 右 へ 変換 され て いく . 逆 に ハー ド ウェ ア 側 で は , 
図 の 右 か ら 左 へ 変換 を 行っ て いく . ソフ トウ ェ ア や ハー ド ウェ ア の 各階 層 の 
実装 に あたっ て は , 自分 が どの アド レス を 扱っ て いる の か に 注意 を 払う 必要 
が ある . 


@ PCI の 階層 で さら に アド レス の 読み 替え を 行う 
図 6 に 示す よう に , ロー カル ・ メ モリ 空間 へ の アク セス 
は PCI バス を 中 継 し て 行わ れ ま す . これ は , ロー カル ・ メ 
リ 空間 A を POI タ ー ゲ ッ ト ・ デ バイ ス ( ここ で は PQI バ 
ス に 挿し て ある FPGA ボー ド の こと ) の メモ リ 空間 B へ マ 
ッ プ し , その 空間 B を 読み 書き する こと で 実現 され ます 
( 図 7). メモ リ 空間 B は , さら に パソ コン の 実 メ モリ 空間 
C に マッ プ さ れ , そこ で 初め て PCI バス 上 で 現実 の デー タ 


表 6 PCI ド ライ バ ・ ソ フト ウェ ア が 提供 する 基本 関数 群 
( http://www.otto.to/kasiwano/toppage11.htm か ら 抜粋 ) 
表 5 の 各 基 本 関数 の 内 部 で は , これ ら の 関数 群 を 組み 合わ せ て 処理 が 行わ れ 


る . PCI タ ー ゲ ッ ト ・ デ バイ ス へ の デー タ の 読み 書き を 行う も の で ある . 


基本 関数 群 


内 容 


_pciFindPciDevice ) 


PCI ター ゲッ ト ・ デ バイ ス の 各種 情報 デ 
バイ ス ・ ハ ンド ラ に 相当 ) を 取得 する 


_pciConfigReadShor《 ), 
_pciConfigReadLong ) 


PCI ター ゲッ ト ・ デ バイ ス の コン フィ グ 
レー ショ ン ・ レ ジス タ の 読み 出し 


_pciConfigWriteShorf ) 


同 レジ スタ へ の 書き 込み 


_MemReadLong ) 


PCI ター ゲッ ト ・ デ バイ ス の メモ リ 空間 
の 読み 出し 


_MemWriteLong ) 


同 メ モリ 空間 へ の 書き 込み 


_MemReadBlockLong ) 


同 メモ リ 空間 の バー スト 読み 出し ( 高速 ) 


_MemWriteBlockLon& ) 


同 メ モリ 空間 へ の バー スト 書き 込み 高速 ) 
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転送 が 行わ れ ま す . 


こう し た メモ リ 空間 の 読み 替え は , ソフ トウ ェ ア や ハー 
ド ウェ ア の 各階 層 で 行わ れ ま す . メモ リ 空間 A か ら B へ の 
読み 替え は 表 5 の 各 関 数 内 部 で 行わ れ ま す . また , メモ リ 
空間 B か ら C へ の 読み 替え は 表 6 の PCI ド ライ バ 関 数 群 で 
行わ れ ま す . ハー ド ウェ ア 側 で は , C か ら B へ , B か ら A 
へ と 逆 の 変換 が 行わ れ , 最終 的 に 画像 処理 IP コア に 到達 
まず 。 

PCI ド ライ バ 関 数 欄 表 6) は PCIDEBUG と いう 有名 な 
も の で す . 詳細 は 参考 文献 3),( ④ を 参照 し て くだ さい . 


@ ソフ ト と ハー ド の 歩調 を 合わ せる 

API 以下 の 階層 を 作る ときには, ソフ トウ ェ ア と ハー ド 
ウェ ア が 同時 に 動い て いる と 意識 する 必要 が あり ます . つ 
まり , ソフ トウ ェ ア と ハー ド ウェア が それ ぞ れ バラ バラ に 
動い て いて は デー タ の や り と り が で き な い の で , な ん ら か 
の 方 法 で 両者 の 交信 タイ ミン グ を 合わ せる 必要 が ある の で 


リス ト 1 API 内 で 使う 補助 関数 の 典型 的 な コー ディ ング 例 

表 4 の レジ スタ へ の デー タ 読み 書き を , 表 6 の 関数 を 使い , PCI タ ー ゲ ッ ト ・ 
デバ イス へ の デー タ 読み 書き に 翻訳 する . 並列 に 動い て いる 回 路側 と ソフ ト 
ウェ ア 側 を 同期 させ る ( 三歩 調 を 合わ せる ) た め , 回 路側 の 処理 状況 を チェ 
ッ ク す る こと に 注意 が 必要 で ある . 


| FPGA に 処理 を 行わ せる 


D1CCODFO_Fed1fF exeoomd (D1CCopro1nfF *p1 ) 


{ 

// rp コア の ステ ー タ ス ・ レ ジス タ を 読み , 処理 中 で な く な る まで 待つ 

while (( MemReadLiong (p1->mem base0 + 0) & 1) == 0) 
中 略 … 

// rp コア の コマ ンド ・ レ ジス タ へ 1 ュ を 書き , 処理 を 開始 させ る 


MTISE CeTongitp ふ < >mem Dase0 + 0, 1): 


// rp コア の ステ ー タ ス ・ レ ジス タ を 読み , 処理 中 で な く な る まで 待つ 
while (( MemReadLond (p1->mem base0 + 0) g 1) == 0) 


) 


図 8 

ステ ー タ ス ・ レ ジス タ の ポー リン グ に よる , ソフ ト 
ウェ ア と ハー ド ウェ ア の 同期 化 ハー ドウ ェ ア ど う 
し で も 同様 ) 

ソフ トウ ェ ア と ハー ドウ ェ ア は 実際 に は 並列 動作 し て い 
る た め , ソフ ト ウェ ア が 何 か 処 理 を 起動 し た り , 結果 を 
取り 出 そ う と する と き は , ハー ド ウェ ア が 準備 を 完了 し 
て いる こと を か な ら ず 確認 し な けれ ば な ら ない. これ に 
は , ハー ドウ ェ ア 上 に ステ ー タ ス ・ レ ジス タ を 設け て ポ 


マラ フラ トウェア 
( API 関 数 ) 図 


す . これ を |「 同期 を と る 」 と いい ます . 
今回 は , 次 の 2 点 に よく 気 を つけ る 必要 が あり ます . 
1) ソフ ト ウェ ア 側 は , 画像 処理 IP コア の 起動 に あたっ て , 
起動 可能 か どう か を 事前 に 確認 する . な お か つ コ ア を 
起動 し た 後 , その 処理 の 終了 を 検知 で きる よう に する 


2) ハー ド ウェ ア 側 は FPGA の ロー カル ・ メ モリ 空間 へ の 
読み 書き が 発生 に し た と き , その アク セス が 完了 し て か 
ら ソ フト ウェ ア 側 ヘリ ター ン す る 


0 BOSS 的 な 誤動作 に つなが 


り ま す . 例え ば , ハー ド ウェ ア 側 が まだ 処理 中 で ある に も 
か か わら ず , ソフ トウ ェ ア 側 が 処理 終了 」 と 勘違い し て 


FPGA レジ スタ を 読ん だ 場合 , 正しい 演算 結果 は 取り 出せ 
ませ ん . また , 逆 に ハー ドウ ェ ア に よる 処理 が すでに 終了 
し て いる の に , ソフ トウ ェ ア 側 が まだ 処理 継続 中 」 と 勘 違 
いす る と , 永久 に ソフ ト ウェ ア 処 理 を 再開 で き な く な っ た 
り し まず この 状態 を デッド ロッ ク 」 と 呼ぶ ). 

上 記 1) に つい て は , ハー ド ウェ ア 側 処理 を 開始 で き 
る か どう か 」 を 表す 専用 の レジ スタ , つま り ス テー タス ・ レ 
ジス タ を 用 意 し て お き , それ を ソフ ト ウェ ア 側 が チェ ッ ク 
ずる こと で 同期 を と る よう に し ます 。 ソ フト ウェ ア と ハー 
ドウ ェ ア の 速度 差 に 注意 する 必要 は あり ます が , 基本 的 に 
は 処理 開始 前 た は ステ ー タ ス ・ レ ジス タ が 1( 処理 開始 可 
能 ) で ある こと を , 処理 開始 後に は ステ ー タ ス ・ レ ジス タ が 
"エゴ 0 づ ] と な る こと を 確認 し まず 図 8 リス ト 1). 

また , 上 記 2) に つい て は , ハー ド ウェア 設計 時 に バス ・ 
アク セス に ウェ イト を か ける な どの 方 法 で 対処 し ます . 

同期 を と る 操作 は , ソフ トウ ェ ア と ハー ド ウェ ア の 間 だ 
け で な く , ハー ドウ ェ ア と ハー ド ウェ ア の 間 で も 用 いま す . 
原則 と し て , 速度 が 異な る 並列 処理 どう し を 連携 させ る と 
き に は 必要 で す . 


ソフ ト ウェ ア は 次 の 処理 へ 区 


~ て て ィ 
処理 開始 図 、 ステ ー タ ス ・ 凶 、 ヽ 
コマ ンド 図 レジ スタ の 凶 ヽ 

ヽ 了 人 2 1) 


ハー ド ウェア 罰 0 1 ヽ ww 1 
( FPGA) 図 


ステ ー タ ス ・ レ ジス タ 図 が 9 


ss 1 
NGI 


ー リ ング 繰り 返し チェ ッ ク ) す る 方 法 が も っ と も 簡単 
で ある . ここ で も っ と も 注意 を 要する の は , ステ ー タ 
ス ・ レ ジス タ の 変化 速度 で ある . ハー ド ウェ ア の 速度 と 
ソフ トウ ェ ア の 速度 が 著しく 異な る 場合 な ど に 致命 的 な 
誤動作 が 発生 する こと が ある . 


ソフ ト ウェ ア か ら コ マン ド を 受け 取っ た ら , 
ソフ ト ウェ ア が チェ ッ ク に 来る より 前 に 0 
に 変え る 必要 あり . そ れ が 難し いな ら , ソ 
フト ウェ ア の ほう で 少し 待つ 図 


も じ 0' に な っ た こと を ソフ トウ ェ ア 側 
が チェ ッ ク し て いる な ら , ポー リン グ 
が 1 度 も 来 な いう ち に 1' に 戻す こと 
が 蘭 い よう に 気 を つけ る 必要 あり 図 
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3| ハー ドウ ェ ア の 詳細 


ここ まで は , ソフ ト ウェ ア に 重点 を 置い て シス テム の 構 
成 を 説明 し て きま し た . 以下 に , ハー ド ウェ ア 側 が どの よ 
うに 作ら れ て いる か を 説明 し ます . 


⑯ ブロ ッ ク ツク 構成 と 全体 的 な 動き 

図 9 に , ハー ド ウェ ア 側 の ブロ ッ ク 図 を 示し ます . 画像 
デー タ を 格納 する SDRAM を 除き , 回 路 ブ ロッ ク は FPGA 
内 部 に 置か れ ま す . 各回 路 ブ ロッ ク は 図 3 の デー タ の 流れ 
どおり に つなが っ て いま す が , SDRAM の 接続 の し か た を 
少し だ け 細 工 し て いま す . この ブロ ッ ク 図 の も と で , 回 路 
が どの よう な 動き を する か を 見 て み ま し ょ う . 

1) 画像 処理 を 何 も 行っ て いな いと き の 動 き 

FPGA が と くに 画像 処理 を 行っ て いな いと き , SDRAM 
と の デー タ 交換 や 画像 処理 IP コ ア へ の 各種 パラ メー タ 設定 
を パソ コン 側 か ら 行う こと が で きま す . この と き デ ー タ は , 
「 パソ コン つっ PCI バス ・ インター フェー ス っ IP コア 制御 部 
っ つっ SDRAM また は IP コア 」 と いう 経路 で 流れ ます . 

な お , 表 4 の レジ スタ 群 の うち , コマ ンド ・ レ ジス タ や 
ステ ー タ ス ・ レ ジス タ は IP コア 制御 部 の ほう に , それ 以外 
の レジ スタ は IP コア の ほう に 置か れ て いま す . IP コア 制 
御 部 で は , コマ ンド ・ レ ジス タ や ステ ー タ ス ・ レ ジス タ へ ヘ へ 
の アク セス は 自分 で 処理 し ます が , それ 以外 の レジ スタ へ 
の アク セス は その まま IP コア の ほう へ 中 継 し ます . 

2) 画像 処理 を 起動 する と き の 動 き 

パソ コン 側 の ソフ ト ウェ ア が 画像 処理 開始 コマ ンド ・ レ 
ジス 包 表 4 の アド レス Ox000000) ぺ 1 を 書き 込む と , IP 
コア 制御 部 か ら 画像 処理 IP コア へ 処理 の スタ ー ト ・ ト リガ 
( パル ス ) が 送ら れ ま す . それ に よっ て , 画像 処理 IP コア 
が 起動 し ます . 

3) 画像 処理 中 の 動き 

画像 処理 IP コア は , 自分 が 処理 を 実行 し て いる 間 は 
SDRAM や 内 部 レジ スタ へ の アク セス 権 を 握り まず 図 9 の 
デー タ ・ セレ クタ を IP コア 側 へ 切り 替え る ). この 間 は , 
パソ コン 側 か ら SDRAM な ど へ ヘア クセ ス し よう と し て も で 
き な く な り ま す . 

また , 画像 処理 IP コア は IP コア 制御 部 へ ,「 処理 を 開始 
で きる か どう か 」 を 表す ステ ー タ ス 信 号 を つね に 送っ て い 
ます . IP コア 制御 部 は , パソ コン が ステ ー タ ス ・ レ ジス タ 


を 読み に 来 た ら , その ステ ー タ ス 信 号 の 値 を 返し ます . こ 
れ に よっ て , パソ コン 側 は 画像 処理 IP コ ア の 状況 を いつ で 
も 知る こと が で きま す . 
4) 画像 処理 後 の 動き 

画像 処理 IP コア は , 処理 が 終わ る と SDRAM や 内 部 レ 
ジス タ へ の アク セス を 手放し ます . その 後 , 1) の 状態 へ 
戻り ます . 


@ 3 種類 の クロ ッ ク 系 統 が 必要 
通常 の RTL 設 計 で あれ ば , 使う クロ ッ ク は 原則 と し て 
1 本 し か あり ませ ん . シス テム を 構成 する 場合 も その よう 
に 単 一 クロ ッ ク で すめ ば 理想 的 な の で す が , 現実 に は 複数 
クロ ッ ク に な る 場合 が 少な く ありません. その お も な 理由 
は , チッ プ の 外 に ある 各種 デバ イス の 動作 クロ ッ ク が まち 
まち で あっ た り , チッ プ の 外 に ある デバ イス より も チッ プ 
内 部 を 高速 動作 させ る 必要 が あっ た り する か ら で す . 

本 シス テム に お ける クロ ッ ク 系 統 図 を 図 10 に 示し ます . 
今回 は FPGA ボー ド を PCI バ ス に つなぐ の で , PCI バ ス ・ 
イン ター フェ ー ス 部 は その PCI バス か ら 供 給 さ れる 33MHz 


PCI バ ス 
PCI ク ロッ ク 較 に FPGA 


PCI バ ス ・ 較 PC バス ・ ト ラン ザク 較 
イン ター フェ ー ス 較 | ショ ン を メモ リ 空間 図 


各種 クロ ッ ク 較 ( PCITGT) 図 | アク セス 信号 に 翻訳 較 
生成 較 


メモ リ 空間 アク セス 信号 図 
か ら , 画像 処理 P コ ア や 図 
SDRAM の アク セス 信号 図 
を デコ ー ド 罰 


画像 処理 図 
IP コア 制御 図 
( busctrl) 図 


トリ ガ , 昌 | デ 


画像 処理 P コ ア 図 
( piccopro) 較 


IP コア 内 部 レジ スタ 図 
SDRAM の 制御 信号 生成 , 図 SPRAM コ ント ロー ラ 凶 
リフ レッ シュ な ど 図 MM 

SDRAM 32 ビ ッ ト X 2M ワ ー ド 罰 

図 9 ハー ド ウェア 側 の 全体 構造 


今回 は デー タ の 流れ どおり に 各 コ ン ポ ー ネ ン ト を 直接 つなぐ 方 法 を と っ て い 
る が , も っ と 複雑 な 処理 を 行う 場合 は , CPU を 用 いて 各 IP コア を バス に ぶ 
ら 下げ て も よい . PCI か ら の SDRAM ア クセ ス は , 画像 処理 IP コア の 停止 中 
に 行え る . 


SDRAM の 凶 
アク セス 元凶 
( IP と PCI) 図 
を 切り 替え 図 
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FPGA 
PCI バ ス ・ 図 
イジ ター ラ タ 呈 包 図 
( PCITGT) 図 ー 
33MHz<>66MHz 正 相 ) 


呈 ラ ン 


33MHz 


画像 処理 図 
IP コア 制御 図 
66MHz 図 ( busctrl) 図 


( 正 相 ) 


画像 処理 IP コア 図 
( piccopro) 較 


IP コア 内 部 レジ スタ 図 


66MHz( 送 相 ) NM ロー ラ 較 
リン テ sdramc) 


ンー 
ーー 界 恋 行う 隊 
デー タ ・ ク ロッ ク の 変換 を 行う 図 SDRAM 32 ビ ッ ト xX 2M ワ ー ド 罰 


( 66MHz 正 相 <>66MHz 逆 相 ) 図 


図 10 クロ ッ ク 系 統 の 構成 
デー タ の 流れ や コン ポー ネン ト 間 の 接続 を 決め る 過程 で , どこ で どの よう な ク 


回 路 と の 接続 部 で は クロ ッ ク 周 波数 が 固定 され る こと が 多い . 
な く リ セッ ト ・ ラ イン の 設計 に も 注意 が 必要 . 


クロ ッ ク だ け で 


クロ ッ ク で 動か す の が 自然 で す ぜ 6. 画像 処理 ITP コア に つ 
いて は , 33MHz 動作 で は 満足 な 性 能 が 得 ら れ な いた め , も 
っ と 高速 な 66MHz ク ロッ ク を 使い ます . また , SDRAM 
チッ プ に つい て は , その 信号 の 遅延 設計 の つ ご う 上, 
SDRAM コン ト ロー ラ の クロ ッ ク か ら 多少 位相 を ずら し た 
クロ ッ ク を つなが ざる を えま せん . その よう な 理由 か ら , 
図 10 に 示し た 3 種類 の クロ ッ ク 系 統 が 必要 と な っ て いま 
す . それ ら の クロ ッ ク は , PCI の バス ・ ク ロッ ク を も と に 
PLI( phase-locked loop) で 作り ます . 

この よう に , どの よう な クロ ッ ク を 用 いる か は , か な り 
の 部 分 が チッ プ 外 部 の 状況 に よっ て 決ま り ま す . 後述 する 


注 6:「 決し て , 異な る クロ ッ ク を 用 いて は いけ な い 」 と いう こと で は な い 
が , PCI バ ス ・ イ ンタ ー フ ェ ー ス の 回 路 設 計 が と て も や っ か い に な る . 
注 7: 各 ブ ロッ ク の リセ ッ ト を どの よう な 順番 で 解除 し て いく か を 検討 し , 
場合 に よっ て は チッ プ 外 部 か ら の リ セット 信号 を 受け て 内 部 へ 分 配 す 
る ( 解除 順 も 制御 する ) 専用 モジ ュー ル を 設け る こと も ある . 
注 8: 回 路 製作 に あたり , 来栖 川 電工 の 井倉 将 実 氏 か ら PCI タ ー ゲ ッ ト 回 路 , 
SDRAM イ ンタ ー フ ェ ー ス 回 路 , お よび 関連 情報 な ど を ご 提供 いた だ 
いた . 本 稿 作成 物 本 誌 Web サ イト から ダウ ン ロ ー ド 可能 ) に は , 来 
杜 川 電工 の 権利 物 も 含ま れる . 本 文 な ら び に ソー ス ・ コ ー ド 中 に 記載 
され て いる PCI ベン ダ ID : Ox6809 は 来 杜 川 電工 固有 の コー ド で ある . 
PCI デ バイ ス ID : Ox4949 は 来栖 川 電工 か ら CQ 出 版 社 に 寄与 され た 
デバ イス ID で ある . これ ら の ID な ら び に 本 稿 作成 物 の 商業 利用 ユ 
ー ザ 側 で 作成 し た 機器 へ の 採用 な ら び に 製品 の 販売 ) は いっ さい 認め 
られ て いな い の で , 注意 し て いた だ きた い . 
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ロッ ク を 使う か も お お むね 定まっ て くる . と くに , PCI や SDRAM など, 外部 


よう に , 各 モ ジュ ー ル の 論理 設計 に 大 きく 影響 する の で , 
クロ ッ ク 系 統 は シス テム 設計 の 初期 の 段階 で 決定 し て お き 
に 

また , 今回 は と くに 問題 と な り ま せん で し た が , クロ ッ 
ク 系統 が 複数 ある 場合 , パワ ーON や リセ ッ ト 後 の シ ステ 
ム 起 動 が うま くい く か に 十分 注意 する 必要 が あり ます . 例 
えば , パワ ー ON し て か ら PLL が 安定 する まで は 各 シ ステ 
ム を 停止 し て お く の が 安全 で す . また , シス テム ・ リ セッ 
ト 信号 に つい て も , リセ ッ ト 解除 時 に 一 部 の 回 路 が ほか よ 
り 先 に 動き 始め る よう な 状況 が どう し て も 発生 する の で , 
それ で 致命 的 な 問題 が 起き な いか どう か を シス テム 設計 初 
期 に 十分 検討 する 必要 が あり ます 7. 


@ 各 ブ ロッ ク の 機能 と 交信 プロ トコ ル 

それ で は , 図 9 の 各 ブ ロッ ク に つい て 説明 し て いき ます . 
1) PCI バ ス ・ イ ンタ ー フ ェ ー ス 

PCI バ ス ・ イ ンタ ー フ ェ ー ス と し て は , 参考 文献 2, 
( 3) に 収録 され て いる PCI タ ー ゲ ッ ト 回 路 の 設計 デー タ 
( PCITGT ) を VHDL か ら Verilog HDL に 変換 し た うえ で , 
お お むね その まま 用 いて いま す 注 8. PCTTGT は , パソ コ 
ン の PCI バス の プロ トコ ル ( バス 信号 の 変化 の し か た ) を 
図 11 に 示す よう な 単純 な メモ リ ・ ア クセ ス ・ プ ロト コル に 
変換 する 回 路 で す . つま り , 少々 複雑 に 変化 する PCI バ ス 
の 信号 を , 普通 の ROM や SRAM な ど と ほぼ 同じ 「 アド レ 
ス ・ バス デー タ ・ バ スキ イネーブル 信号 」 の イン ター フ 
ェ ー ス に 変換 し ます . PCI バ ス の 詳細 は 参考 文献 3) を 参 
照 し て くだ さい . PCI バ ス の バー スト 転送 , つま り 複数 ア 
ドレ ス へ 連続 的 に デー タ 転送 を 行う 操作 も , 1 アド レス ご 
と の メ モリ ・ ア クセ ス に 切り 分 けら れ ま す . 
2) 画像 処理 IP コア 制御 回 路 

画像 処理 IP コア 制御 回 路 は , PCI バ ス か ら の メモ リ ・ ア 
クセ ス の 一 部 を 処理 し , 後 は 画像 処理 IP コア へ 中 継 し ま 
す . この 回 路 は , 図 11 の よう な イン ター フェ ー ス を 持っ 
て お り , PCI か ら の メモ リ ・ サ イク ル が ある と 画像 処理 IP 
コア や SDRAM へ の メ モリ ・ サ イク ル を 開始 し ます . この 
よう に 書く と と て も 単純 な 回 路 で すみ そう で す が , 実際 に 
は や や 複雑 で す . 

まず , 図 7 に 示し た と お り , PCI タ ー ゲ ッ ト ・ デ バイ ス 
上 で の アド レス を 表 4 の FPGA ロー カル ・ ア ドレ ス へ 逆 変 
換 し , その 結果 に 応じ て 画像 処理 IP コア , SDRAM, お よ 
び 自 分 自 長 IP コア 制御 回 路 ) の いずれ に アク セス する べき 


染 


ー Ao シン ピ てこ 2 
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アド レス ・ バ ス 較 -ー 

入力 デー タ ・ バス 図 - テ 

デー タ の 上 流 側 較 出力 デー タ ・ バス 図 一 | ~ 
( PC な ど ) 図 バス . サイ クル ・ スタ ー ト 図 -~- 
デー タ 方 向 指示 図 -- 


ーー アド レス ・ バ ス 図 

ーー 入力 デー タ ・ バ ス 較 

ュー 出力 デー タ ・ バス 図 デー タ の 下流 側 較 
ーーー バス ・ サ イク ル ・ ス ター ト 図 ( P コ ア , SDRAM な ど ) 凶 
ーー デー タ 方 向 指示 図 

ューー バス ・ サイ クル 完了 較 

各種 制御 信太 トリ ガ な ど ) 凶 


上 流 側 の バス ・ サ イク ル が 始ま っ た 
下流 側 の バス ・ サ イク ル を 開始 図 


アド レス 図 
上 流 側 の 図 0 
バス ・ サ イク ル 図 
& ラ イト ・ イ ネー ブル 較 
バス ・ サ イク ル 完 了 図 
アド レス 図 
下流 側 の 図 2 va 
バス ・ サ イク ル 図 


バス ・ サ イク ル ・ ス ター ト 較 
& ラ イト ・ イ ネー ブル 較 


バス ・ サ イク ル 完 了 図 


図 11 各 ブ ロッ ク の 典型 的 な 1/O 端子 構成 


各 ブ ロッ ク は , 上 流 か ら の メモ リ 空間 アク セス を 解釈 し , 自分 で 処理 すべ きも の は 処理 し , ある い は さら に 下流 の メモ リ 空間 アク セス へ 中 継 す る . この 図 で は 上 


流 と 下流 の バス 端子 や バス ・ プ ロト コル が 同一 で ある が, 一般 に は 同じ と は 限ら な い の で , それ ら の 変換 も 適宜 行う とくに, クロ ッ ク 系 が 異な る 場合 は 注意 が 
必要 で ある . 上 流 , 下流 の 接続 に 使う 信号 の 種類 は , デー タ ・ バ ス , アド レス ・ バ ス , バス ・ サ イク ル の 開始 ・ 終了 通知 信号 な ど が 一 般 的 . 


リス ト 2 
画像 処理 IP コア 制御 部 の IA 
内 部 回 路 の 典型 人 抜 和 ) apetgn 上 


PCI か ら FPGA メ モリ 空間 
へ の ライ ト ・ ア クセ ス が 来 
た と き , それ を デコ ー ド し 


execC SEar regd <= 3'b000: 


PC アド レス を デコ ー ド 較 


Se1 Command = (nPCT CS0O == 1!b0 g&& PCT A == 0) ? 1'b1 : 1!b0: ュー 


a1way8 @(posedge MEMCLK or negedge nRESET) begin 5 5 ロ 5 時 
1 (nRESBET == 1ib0) begin コマ ンド ・ レ ジス タ へ 値 1' を 書き 込む 要求 が 来 た ら , 図 
画像 処理 P コ ア の スタ ー ト ・ パ ルス を 生成 する 図 
end e1se begin 


て IP コア の スタ ー ト ・ パル ifF (se]1 command == 1'b1 gg nPCT WEO == 1'bO gg PCT D T[0] == 1'b1) begin 
ス を 生成 する 部 分 を 示す 上 exeC Star 上 reg[0] <= exxec_ ready: 同期 人 NN 
ロー ド <。 、 ぶ 牛 en 司 } 4 
M に 4 暫 同 exeC_8 ヒ ar 上 reg[2:1] <= exxeC _ Star reg[1:0] : フ 

を 加 還 end 微分 し て スタ ー ト ・ パ ルス を 生成 
ド し て 処理 する . 内 

a881gn exeC Sar ヒ = (<-exxeC_S 上 ar 上 reg[2] ) g& exec gtar redg[1] : ノノ 

か を 判断 し ます . ク 系 の 変換 を 行い ます . これ は 回 路 実装 に あたっ て 注意 


次 に , コマ ンド ・ レ ジス タ や ステ ー タ ス ・ レ ジス タ へ の 
アク セス で ある 場合 , 画像 処理 IP コア の スタ ー ト ・ パ ルス 
生成 な ど を 適宜 行い まず リス ト 2). リス ト 2 の コー ド は 
と くに 難し いも の で は あり ませ ん が , 参考 文献 1) な ども 
参照 し て くだ さい . 

また , PCI バ ス 側 は 33MHz ク ロッ ク 系 で す が , 画像 処 
理 IP コア や SDRAM は 66MHz クロ ッ ク 系 な の で , クロ ッ 


要する 部 分 な の で , 後 で 詳し く 説明 し ます . 
3) SDRAM コン ト ロー ラ 

参考 文献 2) に 収録 され て いる 設計 デー タ ( sdramc) を 
Verilog HDL に 変換 し た うえ で , シミ ュ レ ーション 上 の 問 
題 と 異 ク ロッ ク 系 を 接続 する うえ で の 問題 へ の 対応 策 を 施 
し て 使用 し て いま す . これ は , 図 11 の よう な メモ リ ・ ア 
クセ ス 信 号 を 受け て , SDRAM の 制御 信号 RAS, CAS な 


「 員 
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ど ) を 生成 し , SDRAM の 読み 書き を 行う 回 路 で す . また , ⑯ クロ ッ ク の 異な る 回 路 ど うし の 接続 に は ひと く ふ う 


タイ マ を 内 蔵 し て お り , 一 定時 間 ご と に SDRAM の リフ レ 図 10 に 示し た と お り , 今回 の シス テム に は 異 ク ロッ ク 系 
ッシュ 操作 を 行い ます . の ブロ ッ ク ど うし の 接続 筒 所 が 二 つ あ り ま す . 一 つ は 画 
4) 画像 処理 IP コア 処理 IP コア 制御 部 33MHz) と 画像 処理 IP コア /SDRAM 
画像 処理 を 行う 本 体 で す . 本 特集 の 第 4 章 を 参照 し て く コン ト ロー ヌ ズ 66MHz), も う 一 つ は SDRAM コ ント ロー 
だ さい . ラ と SDRAM どちら も 66MHz だ が 位相 が 異な る ) で す . 


非常 に よく 知ら れ て いる こと で す が , この よう に 異 ク ロ 
ッ ク 系 の 信号 どう し は , 原則 と し て 直結 し て は いけ ませ ん . 
複数 ビッ ト の バス 較 シン クロ ナイ ザ 凶 回 路 中 の フリ ッ プ フロ ッ ズ FF) の セッ ト アッ プ 時 間 や ホ 


Sd 1 ー ル ド 時 間 の 違反 が 起き て 回路 が 誤動作 する 場合 が ある か 

4 』0 ら で す . その 初歩 的 な 対策 法 は , 信号 を いっ た ん 1^ 2 段 

SM の フリ ッ プ フロ ッ ズ シン クロ ナイ ザ と 呼ぶ ) で 受け る と い 
う も の で ず 9. 

・ ピ > ト 町 mi2 ロ y ク の ずれ が る 能生 が ちる ここ で は , も う 少 し 実用 的 な 方 法 を 二 つ 紹介 し ます . ま 

? シン クロ ナイ ザ が 多 す ぎる 図 ず , クロ ッ ク 系 の 異な る バズ 複数 ビッ ト ) ど うし を 接続 す 

Na 財 o AIB 09 放 る 場合 , その アド レス ・ ラ イン や デー タ ・ ラ イン の 全 ビ ッ 

ト に シン クロ ナイ ザ を 入れ る よう な 設計 を 避け る よう に し 

複数 ビッ ト の バス 図 mey | | ます . 各 ビ ッ ト の 値 が ずれ た り , シン クロ ナイ ザ の 数 が 多 

生 1 ー バス ・ プロ トコ ル を うま く 設 計 し て 。 デー タ く な り 過ぎ た りす る か ら で す . そこ で , 図 12 の よう に ア 

還 間 

data 31] | | s 制 御 信号 に は シン クロ ナイ ザ を 入れ る 図 凍 科 凍 時 寺 AM M 

ready * で きれ ば ハン ド シ ェ イ ク に する と 安全 鐘 間 違 反 が 起き な いよ うな バス ・ プ ロト コル を 使い ます . た 

( b) も う ひ と < く ふう 図 だ し , リク エス ト や アク ノリ ッ ジ と いっ た バス の 制御 信号 


図 12 クロ ッ ク の 異な る バス どう し の 接続 Ve 0 
クロ ッ ク 系 の 異な る 回 路 ど うし の 接続 に シン クロ ナイ 棒 1 て 2 段 の フリ ッ プ フ に は シン クロ ナイ ザ が 必要 で す 。 

ロッ プ ) が 必要 な こと は よく 知ら れ て いる が , 実際 に は それ だ け で は 不 十分 . また , 1 クロ ッ ク 幅 の パル ス を 相手 方 へ 送る よう な 場合 , 
バス な どの 複数 ビッ ト の ライ ン に お いて , ビッ ト 間 で 値 の ずれ が 生じ うる か ら _ 2 ーー 間 

で ある . 相手 方 で セッ ト ア ッ プ / ホ ー ル ド 時 間 フリ ッ プ フロ ッ プ で は , クロ ッ 相手 の クロ ッ ク 周 波数 が 自分 の クロ ッ ク 周 波数 の 2 倍 より 
ク の 立ち 上 が り 前 後 の 一 定時 間 , デー タ 入力 値 を 変化 させ て は な ら な い . その 


時 間 の こと ) の 違反 が 起き な いよ うに パス ・ プ ロト コル を 設計 すれ ば , デー タ ・ 遅 けれ ば , 図 13 の よう に バル ス 幅 を 引き 伸ばす 必要 が あ 
ライ ン や アド レス ・ ラ イン の シン クロ ナイ ザ を な くす こと が で きる . り ま す . パル ス 幅 は , 相手 の クロ ッ ク 周 期 の 2 倍 以 上 に し 


も し パル ス に ハザード が の っ て いる な ら , これ は 
つなが ず に フリ ッ プ フロ ッ プ を も う 一 つ 増 や す 図 


9 クロ ッ ク 境界 図 
1 aa 0 


ここ に ハザード を の せな いよ う に する 義 


」 IJPRN。 
レ 
CLRN 
條 上 バル ス 幅 引き 伸ばし ( クロ ッ ク 速度 が 相手 より 速い 場合 ) 図 シン クロ ナイ ザ 較 。 微分 回 牙 図 


13 クロ ッ ク 速 度 が 異な る 場合 の パル ス の 受け 渡し 

クロ ッ ク 系 の 異な る 回 路 へ 処理 スタ ー ト 信号 や 処理 完了 信号 を 送る と き は , 1 クロ ッ ク ・ パ ルス は 避け て ハン ド シェ イク ( 1 回 デー タ を や り と りす る た びに , か な 
ら ず 送り 手 と 受け 手 で 確認 を 取り 合う プロトコル. 詳し く は 参考 文 南 1),( 6) を 参照 ) を 行う と よい . し か し , 既存 の IP コア を 利用 する 場合 な ど , どう し て も 1 
パル ス の 信号 し か 得 ら れ な いな ら ば , 図 の よう に 相手 が 受け 取れ る だ け の パル ス 長 相手 の クロ ッ ク 周 期 の 2 倍 以上 ) へ 引き 伸ばす 必要 が ある . また , 相手 方 へ 送 
る 信号 に ハザード を の せな いこ と も 重要 . ダイ ナミ ッ ク ・ ハ ザー ド ( 信号 値 が 確定 する まで の 信号 の バタ バタ ) が パル ス と し て 伝播 し て し まう 可能 性 が ある . 
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ます . その よう に し な いと , 相手 方 が パル ス を 取り こぼす 
場合 が ある か ら で す . 今回 は , 画像 処理 IP コア 制御 部 と 
SDRAM コ ント ロー ラ の 間 の 接続 に この 方 法 を 利用 し て い 
ます . 

以上 の よう な 対策 を いい 加減 に 済ま せる と ,「 ハー ドウ 
ェ ア の 実機 が と きど き 誤 動作 し た り , デッド ロッ ク す る 」 


と いう タチ の 悪い バグ が 発生 し や すく な り ま す . 


回 実機 を 動か す た め の テス ト 戦 略 


で は , 最後 に 実機 を 動か すう え で の テス ト の や り か た に 
つい て 説明 し ます . 


@ 経験 則 か ら 見 る 実機 が 動か な い 理由 と 原因 
以下 に , 実機 で 回 路 を テス ト する うえ で の 筆者 の 経験 則 

を 紹介 し ます . 

e 実機 が 動か か な かい とき は ケア レス ・ ミ スー 実機 が 動か な 
いと き の 原 因 は ほん の 小さ な ケア レス ・ ミ ス で ある 場合 
が も っ と も 多い . 例え ば , ちょ っ と し た タイ ミン グ の 勘 
違い や , 正論 理 と 負 論 理 の 甚 違 いな ど で あ る . アル ゴリ 
ズム が お か し いよ うな こと は どちら か と 言え ば まれ . 

e 誤動作 と 原因 に は ギャ ッ プ が ある 一 表立っ て 見 える 誤 
動作 と ほん と う の 原因 の 間 の ギャ ッ プ が 大 きく , な か な 
か 原因 を つか め な いこ と が 多い . 原因 が わか っ た 後 で も , 
な ぜ そ の よう な 論 動 作 に つなが っ た の か 説明 の つか な い 
こと が し ば し ば ある *9. 

e チップ 外部 や 異 ク ロッ ク 系 と の 接続 が 問題 に な りや すい 
ーー チッ プ 外 の 回 路 や 異 クロ ッ ク 系 の 接続 部 で は 問題 が 
発生 し や すい . まっ た く 動か な い 場 合 も ある し , と きど 
き 動 か な く な る と いう よう に 不安 定 な 場合 も ある 注 10. チ 
ッ プ 外 に ある バス や デバ イス な ど で , その 仕様 書 と 実機 
の 動き が 人 違っ て いる 場合 も と きど き あ る . こう し た 問題 
は , シミ ュ レ ーション で は と て も 発見 し に くい . 

e 同期 回 路 の 不 ぐ あい で は クロ ッ ク や 遅延 を チェ ッ ク ー 一 
チッ プ 内 の 論理 部 分 , と くに 単 ー- ク ロッ ク の 同期 回 路 に 
な っ て いる 部 分 は , まず まち が いな く シミ ュ レ ーション 


( 〇 


注 9: 例え ば , ソフ トウ ェ ア ・ プ ログ ラミ ング の メモ リ ・ リ ー ク に 起因 する 

誤動作 で は , な ぜ そ の よう な 誤動作 に 至っ た の か を 説明 し に くい . 原 

と 誤動作 の 間 に 多 く の 処理 が は さま り がち だ か ら で あ る . 感覚 と し 
て は それ と 同じ . 

注 10: まっ た く 動か な い 場 合 は ケア レス ・ ミ ス , 動き が 不安 定 な 場合 は タ 
イミ ング 遅延 ) 設計 や 異 ク ロッ ク 系 どう し の 接続 の 問題 を ま ず 疑 っ 
て みる と よい 、. 


どおり に 動く . 同期 回 路 に も か か わら ず 動 か な い 場 合 , 
クロ ッ ク 周 期 が 速 す ぎる か , 回 路 入出 力 部 で 遅延 が 間 に 
合っ て いな いこ と が 多い . 

これ ら を 念頭 に 置い て , 以下 を 読み 進め て くだ さい . 


⑱ まず シミ ュ レ ーション を 行っ て か ら 実 機 テ スト へ 移る 
実機 を 動か す 前 に , めん どう で も シミ ュ レ ーション を ひ 
と と お り 通 すこ と を お 勧め し ます . 今回 の 事例 で あれ ば ぱ , 
PCI バ ス や SDRAM コン トロ ー ラ な ど に つい て , いき な り 
実機 で デバ ッ グ し な が ら 回 路 を 作り 込む こと も 不可 能 で は 
あり ませ ん . し か し , 一 見 回 り 道 の よ う で も , シミ ュ レ ー 
ショ ン を 行う こと に は , 次 の よう な メリ ッ ト が あり ます . 
e 実機 ご は わか り づ らい ケア レス ・ ミ ス の 大 半 を すぐ 除去 
で きる 
e も し 実機 が 動か な か っ た 場合 , シミ ュ レ ーション し て あ 
る 部 分 を 原因 か ら 除外 で きる 
e 複数 人 で 分 担 し て 回 路 を 作成 する 場合 , 同じ シミ ュ レ ー シ 
ョ ン 環 境 を 共有 し て お け ば 回 路 結合 時 の トラ ブル が 減る 
実機 に よる 合わ せ 込 み を 行う 箇所 を , 遅延 タイ ミン グ の 
微 調整 くら い に し て お く と , 結果 的 に 回 路 設計 が ずっ と 
効率 的 に 進み ます . 今回 は , SDRAM チ ッ プ や PQI イ ニ 
シ エ ー 信 パソ コン 側 の PCI イ ンタ ー フ ェ ー ス に 相当 ) な ど 


メモ リ ・ ア クセ ス 
命令 な どの 比 列 


画像 処理 IP コア 制御 図 
の RTL 


画像 処理 P コ ア の 図 
RTL 


SDRAM コ ント ロー ラ 図 
の RTL 


SDRAM 図 
MT48LC2M32 の 図 
ビヘイビア ・ モ デル 図 


図 14 今回 構築 し た ハー ドウ ェ ア の シミ ュ レ ーション 環境 

今回 は ソフ ト ウェ ア と ハー ド ウェ ア の 協調 シミ ュ レ ーション まで は 行っ て い 
な い が , PC 経由 で メモ リ ・ ア クセ ス 命 令 を 送り 込む テス ト は 実施 し て いる 
PCI や SDRAM の ビヘイビア ・ モ デル は 無償 で 入手 で きる . きっ ちり し た シミ 
ュ レ ーション 環境 を 構築 し て お け ば , 複数 人 で の 分 担 開 発 も スム ー ズ に な る 
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図 15 PCI ク ロッ ク 図 


チッ プ の 外側 か ら 内 側 へ 向かっ て 
ボ ト ム ア ッ プ に テス ト する 

実機 を 動か そう と する と き は , 一 見 
回 り 道 の よう だ が , シミ ュ レ ー シ ョ 
ン を 行っ て か ら 実 機 で 試す こと , そ 
し て いき な りす べ て の 回 路 を 実機 に 
実装 し な いこ と が 得策 で ある . テス 
ト で は , PCI バ ス や SDRAM の イン 
ター フェ ー ス な ど , チッ プ 外 部 と の 
接続 部 が 安定 し て 動く こと を ます 押 
さえ る ( 電気 的 , 機械 的 な 問題 な ど で 
不安 定 な 動作 が 起き や すい ). それ が 
で き て 初め て 内 部 論理 の 動作 確認 に 
移る . 内 部 論理 に つい て も , まず レ 


画像 処理 IP コア 図 
( piccopro) 図 


PCI バ ス 図 


PCI バ ス ・ 図 
イン ター フェ ー ス 較 
( PCITGT) 図 


画像 処理 図 
IP コア 制御 凶 
( busctrl) 較 


ジス タ 読み 書き の よう な 簡単 な 機能 


IP コア 内 部 レジ スタ 較 


か ら 始め て , 徐々 に 複雑 な 機能 を 試 S 


し て いく . 経験 的 に は , レジ スタ や 
メモ リ の 読み 書き が 安定 し て で きる 
まで が 心理 的 に も ) 長く , 後 は 比較 
的 早い . 


【 検証 1】 図 
FPGA が 生き て いて , プロ グラ 較 
ミン グ で きる か まず チェ ッ ク 罰 


【 検証 2】 図 

PCI バ ス ・ イ ンタ ー フ ェ ー ス を 較 
シミ ュ レ ーション で チェ ッ ク 罰 
( PLL も チェ ッ ク ) 凶 


【 検証 3】 図 

PCI バ ス ・ イ ンタ ー フ ェ ー ス に 較 
レジ スタ を つなぎ , 読み 書き 図 
で きる か 実機 で チェ ッ ク 較 


へ 


【 検証 4】 区 
SDRAM イ ンタ ー フ ェ ー ス を 図 
シミ ュ レ ーション で チェ ッ ク 図 


3 間 

【 検証 5】 図 
PCI バ ス と SDRAM を つなぎ , 較 
読み 書き で きる か 実機 で チェ ッ ク 図 


【 検証 6】 区 
画像 処理 P コ ア を シミ ュ レ ー 罰 
ショ ン で チェ ッ ク 図 


SDRAM コ ント ロー ラ 凶 
(sdramc) 


【 検証 8】 較 


機能 を 実機 で チェ ッ ク 加 


【 検証 7】 較 
画像 処理 P コ ア の 個々 の 較 | 画像 処理 P コ ア の レジ スタ の 


SDRAM 図 
32 ビ ッ ト x 2M ワ ー ド 図 


読み 書き を 実機 で チェ ッ ク 図 


の チッ プ 外 の 部 品 に つい て は , 参考 文献 7)<( 9) な どか 
ら 無償 の ビヘイビア ・ モ デル を 入手 し , PLL に つい て は 
Quartus II Altera 社 の FPGA 開発 ツー ル ) に ビヘイビア ・ 
モデ ル を 生成 させ る こと で , 図 14 の シミ ュ レ ーション 環 
境 を 作り まし た . 


⑯ 実 チ ッ プ は 外側 か ら 内 側 へ 向かっ つて テス ト す る 

シミ ュ レ ーション で 動作 を 確認 し た ら , 実機 に よる テス 
ト を 始め ます . この と き , いき な り FPGA に すべ て の 回 路 
を 実装 し て 動か そう と し た り せ ず , 図 15 に 示す よう に 足 
り の 部 分 か ら 順番 に 固め の て いき ます . 
まず , その ボー ド が 初め て 使う も の で あれ ば , 電源 が 入 
る か , FPGA デバ イス が 生き て いる か , FPGA に プロ グラ 
ミン 欠 コン フィ グレ ーション ) で きる か , クロ ッ ク 信 号 が 
入っ て いる か な ど に つい て 簡単 な 回 路 ま せ で テス ト し て お 
きま す . 
それ か ら タ ー ゲ ッ ト の 回 路 を 動作 させ て いく こと に な り 
ます が , まず PCI バ ス ・ イ ンタ ー フ ェ ー ス や SDRAM コン 
トロ ー ラ な ど , チッ プ 外 と 交信 する ブロ ッ ク だ け を 個別 に 
動か し て テス ト し ます . この と き , デー タ 値 に か か わら ず 


回 


注 11: 例え ば , スイ ッ チ を 押す と LED が 点滅 する よう な 回 路 な ど が よい . 
注 12: デー タ と し て は オー ル O , オー ル 1', 1 ビッ ト だ げ 1 , 1 ビッ ト 
だ げ O , 2 進 の ' 0101…0101" や" 1010… 1010" な どの 値 を 使う と , 
クロ スト ー ク な どの 電気 的 要因 に よる 誤動作 や 結線 ミス を チェ ッ ク 
で きる . 
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正しく デー タ 転送 が 行え る か , と きど き デ ー タ が 化け て 転 
送 さ れる こと が な いか 注 14 メモ リ の リフ レッ シュ が 行わ れ 
て いる か , と いう よう な 安定 性 を と くに 重点 的 に チェ ッ ク 
し ます . こう し た 基本 動作 が 確実 に 行え な いと , 残り の 回 
路 の デバ ッ グ 時 に 問題 の 切り 分 けが で き な く な る か ら で す . 
ここ まで 到達 し て 初め て , 画像 処理 IP コア な ど , チッ プ 
内 部 の 論理 を FPGA に 実装 する こと が で きま す . IP コア の 
テス ト で は , まず レジ スタ の 読み 書き が チッ プ 外 か ら 実 ? 
で きる か どう か を 調べ て くだ さい . レジ スタ の 読み 
え で きれ ば , 後 は シミ ュ レ ーション どおり に すん な り 動 く 
場合 が 多い よう で す . 


昌 
の 
(ん 


⑯ ソフ ト ・ ハ ー ド の ベア は 中 央 か ら 外 側 へ 向かっ つて テス ト 
今回 の よう に ソフ トウ ェ ア と ハー ド ウェ ア の 組み 合わ さ 
っ た シス テム の 場合 , これ まで 説明 し た 実機 テス ト 手順 の 
で , ソフ トウ ェ ア も あわ せ て テス ト し て いく こと に な り 
ます . その と き , 図 3 に 示し た ペア の 真ん中 か ら 外側 へ 向 
か っ て テス ト は 進み まず 図 16). 

今回 の 場合 , FPGA 上 の PCI バス ・ インターフェース 回 
路 を テス ト する 際 に , ソフ ト ウェ ア 側 の PCI ド ライ バ 
( PCIDEBUG) も あわ せ て テス ト し ます . 回 路 の テス ト が 
チッ プ の 外側 か ら 内 部 へ 進ん で いく に し た が っ て , ソフ ト 
ウェ ア も PCI ド ライ バーFPGA 駆動 APh つ アプ リ ケー ショ 
ン と いう 順番 で 動か し て いき ます . 


癌 TN 
【 検証 6】 較 
画像 処理 P コ ア の 個々 の 機能 を チェ ッ ク 較 | 


アプ リケーション ・ プ ログ ラム 上 
( 今回 は 画像 処理 GUI) 図 


_J【 検証 1】 図 
FPGA ボー ド を PCI タ ー ゲ ッ ト と し て 図 
認識 で きる か チェ ッ ク 較 


【 検証 4】 較 し | 
画像 処理 IP コア 制御 レジ スタ に 較 
アク セス で きる か チェ ッ ク 図 


画像 処理 FPGA 駆動 用 API 


ー ノ 【 検証 2】 
FPGA 上 の レジ スタ を PC| 経 由 で 
し 読み 書き で きる か チェ ッ ク 較 


へ 


【 検証 5】 図 


SDRAM の 読み 書き が で きる か チェ ッ ク 較 | NE 1 放 【 検証 3】 図 
フ ・ ド ライ バ 


PCI の バー スト 転送 モー ド が 図 
動作 する か チェ ッ ク 加 


SN 
ーJ 【 検証 3'】 図 
も し 使う な ら , PCI 経 由 で 割り 込み を 了 
か けら れる か チェ ッ ク 罰 


画像 処 


図 16 


IP コア 制御 回 路 団 


ソフ ト と ハー ド を あわ せ た 実 機 テ スト は , 


ソフ ト の 下流 か ら 上 流 へ 向かっ て 

あたり まえ の こと だ が , 実機 で は ソフ ト ウェ ア 
の 下流 が 動か な けれ ば 上 流 を 実行 する こと が で 
き な い . た だ し , 実機 テス ト で な く ソ フト ウェ 
ア 開 発 コー ディ ング ) は , ハー ド ウェ ア の エ 
ミュ レー タ な ど を 用 いて 回 路側 の 進行 に 極力 縛 
られ な いよ うに 行う べき で ある . 


画像 処理 IP コア 


SDRAM 図 


イン ター フェ ー ス 回 路 凶 


な お , ここ で 述べ て いる の ば 実機 チ テスト に お いて は ソフ 
トウ ェ ア を 下流 ハー ド ウェ ア 側 ) か ら 上 流 へ 向かっ て 動か 
し て いく 」 と いう 意味 で す . ソフ ト ウェ ア 作 成 そ の も の を 下 
か ら 上 へ 行う と いう 意味 で は な い の で 注意 し て くだ さい . 実 
務 に お いて は , ハー ド ウェ ア の 実機 が で きる 前 に ソフ トウ 
ェ ア を 先行 開発 する こと が ご く 普通 に 行わ れ て いま す . 
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